开源项目,开源代码,开源文档,开源新闻,开源社区

经过昨天的准备工作，今天基本就可以编写整个k-means算法程序了。今天编写的时候遇到了一个问题，是combine操作时遇到的问题。除了这个问题基本都按照原来的思路进行。先说下我的思路吧。准备工

Hadoopp 2012-09-28 6420 0

Mageia 4

的算法，其主要是来计算数据聚集的算法，主要通过不断地取离种子点最近均值的算法。问题 K-Means 算法主要解决的问题如下图所示。我们可以看到，在图的左边有一些点，我们用肉眼可以看出来有四个点

jopen 2012-06-29 46620 0

算法

种。目前聚类广泛应用于统计学、生物学、数据库技术和市场营销等领域。 K-means算法是一种最简单的聚类算法。 2. K-means算法 2.1. 问题提出上图中有七个样本点，将其分为两类（K=2），如何聚类？

jopen 2013-12-14 32207 0

算法

在一台机器上运行时，就可以选择使用Mahout，让你的数据在Hadoop集群的进行分析。Mahout某些部分的实现直接创建在Hadoop之上，这就使得其具有进行大数据处理的能力，也是Mahout最大的优势所在。相比较于

jopen 2013-12-06 71565 0

Mahout Hadoop 算法

P3

K-Means 聚类示例发布日期：2012-11-08 15:58:16 发布人：本站编辑来源：本站原创浏览次数： 1103 次 1 简介 (1)K-means算法将数据对象描述成n唯空间中的

songyl525 2013-12-11 672 0

import java.util.Random import spark.SparkContext import spark.SparkContext._ import spark.examples.Vector._ object SparkKMeans { /** * line -> vector */ def parseVector (line: String) : Vector = { re

ye34 2015-01-06 10217 2

算法

http://www.thebigdata.cn/JieJueFangAn/14498.html 背景 K-means也是聚类算法中最简单的一种了，但是里面包含的思想却是不一般。最早我使用并实现这个算法是在学习韩

jopen 2015-07-04 11856 0

算法

Liu_LongPo的专栏（@Liu_LongPo） K-means算法属于无监督学习聚类算法，其计算步骤还是挺简单的，思想也挺容易理解，而且还可以在思想中体会到EM算法的思想。 K-means 算法的优缺点： 1.优点：容易实现

fff8 2015-05-26 50946 0

机器学习

。第 5-10 行的代码目的是：在保持图像比例不变的前提下，改变图像的尺寸。步骤一：利用 K-Means 对颜色聚类分析给定之前的两个假设条件，我们打算利用聚类来解决问题。我们拥有一大堆点的数

www345 2015-11-16 29881 0

Python Python开发

cnblogs.com/BaiYiShaoNian/p/4922267.html 机器学习六--K-means 聚类算法想想常见的分类算法有决策树、Logistic 回归、 SVM 、贝叶斯等。分

jopen 2015-11-01 25639 0

算法机器学习

754381 /*** * @author YangXin * @info 利用点集测试K-Means聚类算法 */ package unitNine; import java.util.ArrayList;

DeliaPitt 2016-02-28 20084 0

算法

K-Means应该是最简单的聚类算法之一了吧，理论上很简单，就是随即初始化几个中心点，不断的把他们周围的对象聚集起来，然后根据这群对象的重置中心点，不断的迭代，最终找到最合适的几个中心点，就算完成了。

清风无岸 2017-02-12 13072 0

K-means Python Python开发

Hadoop是一个用于运行应用程序在大型集群的廉价硬件设备上的框架。Hadoop为应用程序透明的提供了一组稳定/可靠的接口和数据运动。在Hadoop中实现了Google的MapReduce算法，它能够

码头工人 2019-01-17 890 0

其它开源项目

找hadoop找到这里，留个脚印

qooxdoo 2010-11-28 1466 0

手机应用

P7

2013-12-5文章内容来自：Java私塾 Hadoop实战-初级部分之 Hadoop IO 整体课程概览第一部分：开始云计算之旅第二部分：初识Hadoop 第三部分：Hadoop 环境安装部署第四部分：Hadoop Shell

singing 2014-01-07 2012 0

Hadoop 分布式/云计算/大数据

P2

一．Hadoop核心角色 hadoop框架 Hadoop使用主/从（Master/Slave）架构，主要角色有NameNode，DataNode，secondary NameNode，JobTracker，TaskTracker组成。

zhezi7 2012-10-08 2833 0

Hadoop 分布式/云计算/大数据

P

Hadoop是一个分布式系统基础架构，由Apache基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来，Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。<br> Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有着高容错性（fault-tolerent）的特点，并且设计用来部署在低廉的（low-cost）硬件上。而且它提供高传输率（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。HDFS放宽了（relax）POSIX的要求（requirements）这样可以流的形式访问（streaming access）文件系统中的数据。

mimosa1987 2013-01-04 1259 0

Hadoop 分布式/云计算/大数据

P3

一、安装sun的jdk和hadoop，不要使用open-jdk 本人安装的jdk1.7.0.rpm包（默认安装路劲为/usr/java/jdk1.7.0）解压hadoop-0.20.2到：/home/hadoop/

gps2012 2013-01-14 525 0

Hadoop 分布式/云计算/大数据

P6

csdn.net/calvinxiu/archive/2007/02/09/1506112.aspx Hadoop 是Google MapReduce 的一个Java实现。MapReduce是一种简化的分布式

ck614 2010-11-10 4010 0

Hadoop 分布式/云计算/大数据

P

Hadoop作为Apache基金会资助的开源项目，由Doug Cutting带领的团队进行开发，基于Lucene和Nutch等开源项目，实现了Google的GFS和Hadoop能够稳定运行在20个节点的集群；2006年1月，Doug Cutting加入雅虎公司，同年2月Apache Hadoop项目正式支持HDFS和MapReduce的独立开发。同时，新兴公司Cloudera为Hadoop提供了商业支持，帮助企业实现标准化安装，并志愿贡献社区。Hadoop的最新版本是0.21.0，说明其还在不断完善发展之中。<br> Hadoop由分布式存储HDFS和分布式计算MapReduce两部分组成。HDFS是一个master/slave的结构，就通常的部署来说，在master上只运行一个Namenode，而在每一个slave上运行一个Datanode。MapReduce是Google的一项重要技术，它是一个编程模型，用以进行大数据量的计算。MapReduce的名字源于这个模型中的两项核心操作：Map和Reduce。Map是把一组数据一对一的映射为另外的一组数据，Reduce是对一组数据进行归约，映射和归约的规则都由一个函数指定。

Bluth 2012-12-25 321 0

Hadoop 分布式/云计算/大数据

Hadoop k-means 算法实现博客

K-Means 算法经验

K-means算法经验

利用Mahout实现在Hadoop上运行K-Means算法经验

K-Means聚类示例文档

K-means算法(Spark Demo) 代码段

K-means聚类算法资讯

机器学习实战ByMatlab（3）：K-means算法经验

【Python】图像主色的 K-Means 分析经验

机器学习六--K-means聚类算法经验

在内存中执行k-means聚类算法经验

K-Means聚类的Python实践经验

Hadoop 开源项目

hadoop 博客

Hadoop实战-初级部分之 Hadoop IO 文档

Hadoop 认识文档

Hadoop API 文档

hadoop 安装文档

Hadoop入门文档

Hadoop 入门文档

K-means Hadoop 的相关搜索

关键词

Hadoop k-means 算法实现 博客

K-Means 算法 经验

K-means算法 经验

利用Mahout实现在Hadoop上运行K-Means算法 经验

K-Means聚类示例 文档

K-means算法(Spark Demo) 代码段

K-means聚类算法 资讯

机器学习实战ByMatlab（3）：K-means算法 经验

【Python】图像主色的 K-Means 分析 经验

机器学习六--K-means聚类算法 经验

在内存中执行k-means聚类算法 经验

K-Means聚类的Python实践 经验

Hadoop 开源项目

hadoop 博客

Hadoop实战-初级部分 之 Hadoop IO 文档

Hadoop 认识 文档

Hadoop API 文档

hadoop 安装 文档

Hadoop入门 文档

Hadoop 入门 文档

K-means Hadoop 的相关搜索

关键词

Hadoop k-means 算法实现博客

K-Means 算法经验

K-means算法经验

利用Mahout实现在Hadoop上运行K-Means算法经验

K-Means聚类示例文档

K-means聚类算法资讯

机器学习实战ByMatlab（3）：K-means算法经验

【Python】图像主色的 K-Means 分析经验

机器学习六--K-means聚类算法经验

在内存中执行k-means聚类算法经验

K-Means聚类的Python实践经验

Hadoop实战-初级部分之 Hadoop IO 文档

Hadoop 认识文档

hadoop 安装文档

Hadoop入门文档

Hadoop 入门文档